Meta lanza SAM Audio, IA que aísla sonidos con texto y más

Meta anunció el lanzamiento de SAM Audio, una nueva herramienta impulsada por inteligencia artificial que promete revolucionar la forma en que trabajamos con el sonido. Esta tecnología permite aislar voces, instrumentos y ruidos específicos a partir de una serie de instrucciones sencillas, ya sea mediante texto, referencias visuales o marcas temporales en archivos de audio y video.

El anuncio fue realizado por Mark Zuckerberg, quien destacó que SAM Audio es una evolución del proyecto Segment Anything, que incluye modelos diseñados para segmentar elementos específicos en imágenes y videos, y ahora también en audio. ¡Una gran noticia para quienes trabajan en producción musical, cine o medios digitales!

Según Meta, esta herramienta ofrece un enfoque intuitivo. No necesitas ser un experto en tecnología para usarla. Puedes aislar cualquier sonido de una grabación usando solo algunos comandos simples. Por ejemplo, al escribir “voz cantando” o “ruido de tráfico”, puedes extraer exactamente esos elementos del audio. Además, podés seleccionar visualmente en un video el objeto o persona que produce el sonido que deseás aislar.

Cómo funciona SAM Audio

Uno de los aspectos más innovadores de SAM Audio es su enfoque multimodal. Además de las indicaciones de texto, que son claras y directas, incorpora algo nuevo: las indicaciones de intervalo. Esto te permite marcar partes específicas del audio que querés resaltar. Así, combina diferentes métodos para imitar cómo las personas identifican y procesan los sonidos en su vida diaria.

Esta capacidad de cruzar distintos tipos de instrucciones busca evitar la fragmentación que muchas herramientas de edición de sonido suelen presentar. Tradicionalmente, estos programas estaban diseñados para tareas específicas, como limpiar pistas o separar voces, pero SAM Audio busca integrar todo en una sola solución más amigable.

Usos y aplicaciones posibles

SAM Audio promete ser útil en varios campos. Podés usarlo en producción musical, podcasting, cine, televisión, y también en la creación de contenido digital o hasta en la investigación científica. Las posibilidades son amplias, como mejorar la calidad de grabaciones al eliminar ruidos de fondo en exteriores o separar instrumentos en una grabación musical.

Por ejemplo, imagina poder limpiar un audio para que se escuche más claro o separar las partes de una canción de manera rápida y eficiente. Esta herramienta facilita muchas tareas que a menudo son complicadas y requieren un alto conocimiento técnico.

Disponibilidad y próximos pasos

Para quienes estén interesados, SAM Audio ya se encuentra disponible para pruebas en el Segment Anything Playground. Esto significa que cualquier persona puede experimentar con sus capacidades usando archivos propios o materiales proporcionados por Meta. Además, el modelo se puede descargar para realizar evaluaciones más profundas.

Meta también anunció que está trabajando en integraciones futuras de esta tecnología con otros productos y ha establecido colaboraciones con empresas como Starkey, dedicada a la fabricación de audífonos, y 2gether-International, que apoya proyectos liderados por personas con discapacidad.

Con SAM Audio, Meta establece un nuevo estándar de calidad y eficiencia en el campo del procesamiento de audio, asegurando mejoras significativas en comparación con desarrollos anteriores.

Botão Voltar ao topo